메뉴

#정형 데이터

TC
TechCrunch AI 25일 전
IMP 8

SAP, 창업 18개월 AI 스타트업 인수...10억 유로 투자

글로벌 기업용 소프트웨어巨头 SAP가 창업 18개월 만인 독일 AI 스타트업 'Prior Labs'를 인수하며, 향후 4년간 10억 유로(약 11억 6천만 달러)를 투자해 정형 데이터 특화 AI 연구소로 육성하겠다고 발표했습니다. 또한 무분별한 외부 AI 에이전트의 API 접근을 차단하는 방어적 정책을 취하면서도, 엔비디아의 엔터프라이즈용 에이전트 경쟁 모델인 'NemoClaw'는 공식 승인하여 고객 사용을 허가했습니다.

기업용 AI M&A 정형 데이터
HN
Hacker News 31일 전
IMP 8

LLM 정형화된 출력 평가용 새로운 벤치마크 공개

비정형 데이터를 정형화된 데이터(JSON)로 변환하는 LLM의 정확성을 평가하는 새로운 벤치마크인 SOB(Structured Output Benchmark)가 소개되었습니다. 기존 벤치마크들은 단순히 문법적 오류가 없는지(스키마 준수)만 확인하여 실제 업무 환경에서 발생할 수 있는 값의 환각이나 누락 문제를 잡아내지 못했습니다. 이를 해결하기 위해 SOB는 텍스트, 이미지, 오디오라는 3가지 입력 소스를 바탕으로 값의 정확도와 구조적 완성도 등 7가지 세부 지표를 사용해 실무에 적용 가능한 모델의 진짜 추출 능력을 평가합니다.

벤치마크 LLM 평가 정형 데이터
MP
MarkTechPost 41일 전
IMP 8

랜덤포레스트·캣부스트 능가하는 테이블 데이터 AI 'TabPFN'

전통적인 트리 기반 머신러닝 모델(랜덤포레스트, 캣부스트 등)이 장악하던 테이블 데이터(정형 데이터) 분석 분야에서, 사전 학습된 파운데이션 모델인 'TabPFN'이 뛰어난 정확도를 입증했습니다. 이 모델은 대규모 언어 모델(LLM)처럼 문맥 내 학습(In-context learning)을 활용해 별도의 파인튜닝 없이도 빠르고 정확한 예측을 제공합니다. 또한, 예측 결과를 더 작은 모델로 증류(Distillation)하여 실제 서비스 환경에 빠르게 배포할 수 있는 실용성까지 갖추고 있어 데이터 실무자들에게 매우 중요한 대안으로 떠오르고 있습니다.

머신러닝 정형 데이터 TabPFN